昔のホームページを探したい。キャッシュを閲覧するには?

「○○会社の昔のホームページ探したい」
「過去の自社のホームページを閲覧したい」

こんなことでお困りのことはないでしょうか?

「昔」がいつ頃かにもよりますが、「キャッシュ」を利用して古いホームページを見つけることができます。

そもそもホームページのキャッシュとは

ブラウザ(Chrome・Edge・Safariなど)は通常、インターネットを介してそのページに含まれるすべてのデータ(テキスト、画像、スタイルシート、スクリプトなど)をダウンロードして表示します。
そのため、つい数秒前に更新された情報も、リアルタイムに閲覧することができるわけです。

ただし、この仕組みはいいことばかりではありません。

ユーザーから「○○のページが見たい」とリクエストされるたび、ブラウザはインターネットを介して情報を探しに行き、取得し、ユーザーへ最新の情報を表示することになりますので時間がかかります。
一方ユーザー側では、毎回データの読み込みが発生するため、同じ情報を見ているのに無駄に通信量が発生します。

これを回避するため、ブラウザは毎回最新の情報を探しに行くのではなく、一時的にブラウザ自身にデータを保存し、ユーザーからページの表示をリクエストされたら自分で保存しているデータを表示する、ということを行います。
この、インターネット上の情報を一時的に保存する仕組みのことを「キャッシュ」と呼びます。
キャッシュは、本来インターネットを介して得られるデータをローカルに保存し、次回以降、同じページにアクセスする際に、すばやく表示できるようにするものです。

「キャッシュ」には、ホームページを見ている人にとって次のようなメリットがあります。

ページの読み込み速度の向上

キャッシュされたデータを使用することで、ウェブページの読み込み速度を大幅に向上させることができます。
これは、特に低速なインターネット接続を使用している場合や、大容量のファイルやリソースが含まれているウェブページを閲覧する際に役立ちます。

通信費用の削減

一度キャッシュされたデータは、再びインターネットからダウンロードする必要がないため、通信量が削減されます。
この結果、インターネットの通信費用を抑えることができます。

オフラインでのアクセスが可能に

キャッシュされたウェブページは、インターネットに接続していない状態でも閲覧することができます。
これは、インターネット接続が不安定な場所での閲覧や、特定のページをオフラインで繰り返し参照する場合に便利です。

ホームページの運営する側にも次のようなメリットがあります。

サーバーへの負荷軽減

キャッシュがあることで、ウェブサーバーにリクエストが届かないため、サーバーのネットワークトラフィックやリソース使用量が減少し、パフォーマンスが向上します。

ただし、キャッシュには以下のような欠点も存在します。

最新情報の更新遅れ

キャッシュされたデータは一定期間保持されるため、最新の情報がすぐに反映されないことがあります。
これを防ぐために、運営する側はページのキャッシュ設定を調整し、ページの更新頻度やデータの有効期限を指定する必要などがあります。

ストレージ容量の占有

キャッシュデータが多くなると、デバイスのストレージ容量の一部を占有することになります。
これが問題になる場合は、定期的にキャッシュをクリアすることで、ストレージ容量を解放することができます。

そのため、運営する側は、臨機応変にキャッシュを利用していく必要があります。

ここまでは、基本的に今公開されているホームページについてのお話しでしたが、実は、キャッシュを利用して、すでに閉じられている昔のホームページを探し出すことができるケースがあるのです。

昔のホームページを探す方法

昔のホームページを探す方法として、過去のホームページのデータを保存している「インターネットアーカイブ」サービスを利用するのがおすすめです。
有名なサービスに「Wayback Machine(ウェイバックマシン)」があります。

Wayback Machine(ウェイバックマシン)とは

インターネット上に公開されている膨大なページの情報を保存し、無償で閲覧することができるサービスです。(非営利団体が運営)
1996年以降の5億以上のウェブページをクロール(収集)し保存しているため、ウェブページが削除されてもウェイバックマシンで過去のバージョンを確認することができます。

Wayback Machine(ウェイバックマシン)の利用方法

  1. ウェイバックマシンのウェブサイトにアクセスします。
    https://archive.org/web/
  2. 検索バーに閲覧したいホームページのURLを入力します。
  3. カレンダーから閲覧したい日時を選択します。

全てのホームページが正確に閲覧できるわけではないのですが、この方法で、あらゆる過去のホームページを見ることができるのです。

ホームページの変化から、状況を推測できる

ここまでの方法で、自社であっても競合であっても、ここ数年どのようにホームページが変化してきたか、という経緯を見ることができます。
例えば競合の変化について、○○のコンテンツが変わっているということは、(予想にはなりますが)きっとこういう理由でここが変更されたのであろう、など推測することができます。
あるいは今までなかったコンテンツが競合サイトに追加されているということは、新しいコンテンツが重要な役割を果たしているのかもしれない。自社にそのコンテンツがなければ導入を検討したほうがいいかもしれない、などの判断材料にも使えます。

目的に応じて、Wayback Machine(ウェイバックマシン)などのインターネットアーカイブサービスをうまく利用できるとよいですね。